Aprendizaje por refuerzo inverso de máxima entropía en juegos de campo medio Descubre cómo la máxima entropía permite recuperar políticas óptimas en juegos de campo medio a partir de demostraciones expertas. Algoritmos eficientes con 2026-06-16 · 3 min